#recompensas semánticas

RDA: Agente de diseño de recompensas para aprendizaje por refuerzo

Descubre RDA, un agente basado en VLM que diseña recompensas semánticas para robots. Logra políticas alineadas con instrucciones humanas en manipulación.

2026-06-02 · 2 min